时政
财经
科技
登录
#Andrej Karpathy
关注
howie.serious
1周前
andrej karpathy的每一个知识视频,都是纯金的。值得看个5678遍。 我刚才用40分钟时间完整看了一遍,还差4567遍🤣(包括但不限于:读文稿、相关讨论、和chatgpt探讨、笔记、推特和文章分享……) 现在,ai总结的“干货”\浓缩\精华,过快、过多、过于泛滥(对于平庸的内容,ai总结是必要且有益的); 但是,对于“纯金内容”,那就得采用“5678遍学习法”:不求多快好深,但求深入理解、主动思考、走完学习闭环,对思维和行动有实际助益。 把这个视频加入待看清单吧,哈哈
#知识视频
#Andrej Karpathy
#AI总结
#学习方法
#内容精华
分享
评论 0
0
karminski-牙医
2个月前
斯坦福发了个新的 Transformer 课程,这个课程邀请到了 Andrej Karpathy, Geoffrey Hinton, Jim Fan, Ashish Vaswani 等大佬,可以免费在线观看 地址:
#斯坦福
#Transformer课程
#Andrej Karpathy
#Geoffrey Hinton
#Jim Fan
#Ashish Vaswani
#免费视频
分享
评论 0
0
宝玉
4个月前
深度解析ChatGPT与DeepSeek R1:强化学习如何让大模型学会“思考”? Andrej Karpathy 前几天发的“深度解析像 ChatGPT 的大语言模型“,实在是太长了点,我自己写的翻译软件一运行就崩溃,还要花点时间修复一下(很遗憾 AI 还搞不定),先挑了其中一节讲 DeepSeek R1 的翻译了一下,强化学习如何让大模型学会“思考”。 像 GPT-4o 这种属于传统的预训练和监督微调(SFT)模型,而 o1,DeepSeek R1 这种则属于强化学习(RL)训练模型,能让模型自发地进行更复杂、更具创造力的推理。模型在不断迭代中学会自我回溯、多角度思考,输出更完整的解题过程。 Andrej 对 DeepSeek R1 评价不错,虽然 OpenAI 是首先实现了 RLFT,但DeepSeek R1更公开透明,带来可复现的研究细节,权重可下载。 他也给了日常模型选择上的建议,如果你要解决高难度数学或编程问题,像 R1 这样的“思考型模型”更具优势,但相应的计算与时间成本更长,一些知识性或简单的咨询问题用 GPT-4o 这样的监督微调(SFT)模型就足够了。
#ChatGPT
#DeepSeekR1
#强化学习
#大模型
#Andrej Karpathy
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞